机译:使用置信空间宏作用的多机器人部分可观察的马尔可夫决策过程的分散控制
机译:两个动作部分可观察到的Markov决策过程的单调性属性在部分有序空间上
机译:通过分散的部分可观察的马尔可夫决策过程优化无线网络的时空复用
机译:使用置信空间宏作用的部分可观察马尔可夫决策过程的分散控制
机译:用于集中式和分散式部分可观察的马尔可夫决策过程的算法中的可伸缩性不断增强:在不确定的环境中进行有效的决策和协调。
机译:不确定性下的决策:基于部分可观察的马尔可夫决策过程的神经模型
机译:基于信念空间宏观行为的部分可观测马尔可夫决策过程的分散控制